Machine Learning的資料儲存服務,除了第二天所提到的S3服務以外,還有其他另外五種,這邊也跟大家進一步的分享和比較之間的差別。
1. S3
採Serverless機制運作,有無限的儲存空間可以存放Ojbect Files(各種檔案都可以直接上傳),並可跟許多AWS運算與機器學習服務串接。
2. Redshift
可用於Data Warehousing與OLAP(Online Analytical Processing)服務。
3. Dynamo DB
屬於NoSQL資料庫,可用來儲存訓練好的模型檔案。由於模型的儲存有各種格式,正好適合Dynamo DB這種NoSQL富有彈性的資料定義與儲存結構。背後資源是採用Serverless機制運行,自動做好資源調配。
4. RDS/AURORA
結構化的資料可使用關聯式資料庫來做儲存。用於OLTP(Online Transaction Processing)服務。缺點是需要事先做好機器的資源配置。
5. Open Search(Elastic Search)
所存資料可用於資料檢索用。
6. Elastic Cache
僅供Machine Learning服務的資料暫存之用。
接著我們透過ChatGPT來幫大家出題目和複習一下內容吧!
ChatGPT來出題囉:
以下是三道選擇題以及各自的解答:
問題1:哪種資料儲存服務採用Serverless機制運作,並且有無限的儲存空間可以存放Object Files,可與許多AWS運算與機器學習服務串接?
A. Redshift
B. Dynamo DB
C. S3
答案:C. S3
解答1:S3是採用Serverless機制運作的資料儲存服務,並具有無限的儲存空間,可存放Object Files,也可與許多AWS運算與機器學習服務進行串接。
問題2:哪種資料儲存服務可用於Data Warehousing與OLAP(Online Analytical Processing)服務?
A. RDS/AURORA
B. Elastic Cache
C. Redshift
答案:C. Redshift
解答2:Redshift是可用於Data Warehousing與OLAP服務的資料儲存服務。
問題3:哪種資料儲存服務適合用來儲存訓練好的模型檔案,背後採用Serverless機制運行,自動做好資源調配?
A. Dynamo DB
B. S3
C. Elastic Cache
答案:A. Dynamo DB
解答3:Dynamo DB是一個NoSQL資料庫,適合儲存訓練好的模型檔案,並且背後採用Serverless機制運行,自動做好資源調配。